CAPÍTULO IV
ROTACIÓN DE COMPONENTES
En el proceso de rotación de componentes lo que se hace gráficamente es girar la dirección de
estos nuevos ejes de referencia que van a definir el subespacio sobre el que proyectaremos los datos.
Existen 2 tipos de rotaciones, las rotaciones ortogonales que mantienen los ejes perpendiculares, con lo
cual las componentes resultantes seguirán teniendo la característica de no estar correlacionadas entre sí;
y las rotaciones oblicuas las cuales sacrifican un poco de esa independencia con el objetivo de obtener una
mayor interpretabilidad de las componentes. A su vez dentro de cada tipo hay varios métodos que se
pueden usar, nosotros en este apartado nos centraremos en la rotación Varimax, que es una rotación
ortogonal y es la de uso más extendido.
Lo que buscamos con la rotación de componentes es que cada una de las variables tenga una
correlación máxima con uno de los factores (es decir, uno) y cero con el resto de los factores o
componentes. De tal forma que esto facilite la tarea de asociar a cada factor como esa “variable
subyacente” representada por un grupo de las variables iniciales.
Imaginemos que tenemos un conjunto de datos en
(es decir 3 variables iniciales) que
podríamos agrupar dentro de un determinado elipsoide, y que vamos a representar estos datos en un
plano
(es decir 2 componentes). La metodología hasta aquí usada por el ACP es ir eligiendo
iterativamente como ejes de cada componente el eje sobre el que el conjunto de datos tenga mayor
varianza. En este caso como vamos a tener los datos representados en un plano, tendremos que nuestros
nuevos 2 ejes serán los 2 ejes sobre los que los datos tengan máxima varianza, y que van a coincidir con
los 2 ejes más grandes de este elipsoide imaginario. Bien lo que hacemos al rotar las componentes es rotar
estos 2 ejes (manteniéndolos perpendiculares entre sí) sin variar el plano que generan. La consecuencia
de esto es que todos los puntos originales se van a seguir representando sobre el mismo plano, pero
respecto a unos ejes diferentes, es decir solo van a cambiar sus coordenadas. Esto permite que al rotar las
componentes no perdamos nada del total de varianza explicado por las componentes en su conjunto.
Metodológicamente lo que hacemos es que la información perdida por la primera componente (ya no está
en la dirección en la que los datos tienen máxima varianza, por lo tanto, va a disminuir ese nivel de varianza
captada) va a ser recogida por la segunda. Podríamos generalizar esto diciendo que la información perdida
por las primeras K componentes va a ser recogida por las ultimas M-K componentes.
Matemáticamente la rotación Varimax lo que hace es calcular una variable que llama simplicidad
(
), que es la varianza de los cuadrados de las cargas factoriales (
) para un determinado factor (i).
Adicionalmente lo que se hace comúnmente es aplicar lo que se llama la Normalización de Kaiser, donde
cada
se divide por la comunalidad de la variable inicial “j” (
). Esto se hace para evitar que las con